《Journal of Finance》前主编：金融经济学研究需要重视“可复制性”

（原标题：《Journal of Finance》前主编：金融经济学研究需要重视“可复制性”）

文/李鹏展

科学研究的可信度是建立在新数据的“可复制性”证据之上，“复制”(Replication)的直观概念是重复一项研究的过程，并观察先前的发现是否重新出现。“复制”的任何结果都可以被视为有关先前研究主张的诊断证据。

“复制”可以通过用新的证据来深化理论研究，当人们对一个理论理解最薄弱时，“复制”的价值是最强的。成功的“复制”将提供与最初研究不同条件下的具有普遍性的证据；不成功的“复制”也可以发现最初研究存在的缺陷。

由此可见，“复制”对于科学研究尝试都是必不可少的，但“复制”在金融经济学领域却是相对落后。所有的经济学顶刊都有支持数据和代码共享的政策，但金融学顶刊却并非如此，以三大金融学顶刊为例，JF仅有支持代码共享的政策，JFE要求作者在受到质疑时共享代码，而RFS没有相关政策。

来自杜克大学Campbell R. Harvey 教授分析了关于数据和代码共享政策失败原因以及对该政策实施的一些看法。本文整理自2019年8月发表于《Critical Finance Review》的论文“Replication in Financial Economics”。

Campbell R. Harvey 是《Journal of Finance》2006年-2012年的主编，曾与JFE、RFS的主编合作提出一项政策：

发布非专有数据；
发布代码；
作者无须回答有关数据或者代码的问题；
如果作者在其他项目中使用这些数据，可以独立拥有这些数据一段时间。

虽然该政策在当时推出失败了，但作者认为认真审视该政策是有必要的。于是在这里分享给大家。

一、为什么数据和代码共享政策会失败？

1. 来自作者的阻力

最大的阻力是给作者增加成本。如果作者共享数据和代码，那么类似“代码中有错误”的质疑是不可避免的。如果出现错误，将会对作者产生巨大的影响，会接收到更多人的质疑，这将会不利于创新。

2. 学科差异性

经济学研究大部分使用的是免费的宏观经济数据，而金融学很大程度上依赖于专有数据。当实施一个强有力的数据共享政策时，可能会改变研究的方向。即使一个有趣的但原先高度专有的数据库不适合用于“复制”，但学者依旧可以从中学习到一些东西。

对于物理和生物科学领域来说，拒绝提供原始数据和代码可能会使其论文被撤回，大量的撤回是一种学术不端的行为，被撤回的论文也很少被引用。

值得说明的是，在作者发文前，金融学顶刊没有撤稿记录。然而，在2021年7月，《Journal of Finance》罕见地撤回了一篇2020年刊发的论文，主要原因是该研究的核心实证结果无法复制，研究结果可靠性不足。

3. 吸引优秀论文

2010年，除了QJE之外，所有的顶级经济学期刊都有数据和代码共享政策。金融学顶刊的竞争对手不仅是其他金融学顶刊，还有经济学顶刊。对数据和代码共享的更自由的观点可能会使经济学顶刊上的优秀论文转移到金融学顶刊上。因此金融学顶刊对数据和代码保守的态度，也有可能是其的竞争优势。

二、实现数据和代码共享的三个原因

“许多人认为我们的研究是没有问题的，那么为什么要对完美的研究进行昂贵的无用的重复研究呢？”

第一，支持数据和代码共享可以增加学术不端行为的成本。发表论文的压力是巨大的，因此期刊更喜欢发表有“积极”结果的论文（支持被检验的假设）。但有了共享的数据和代码，其它学者可以轻松地检查结果的准确性和稳健性，从而增加了学术不端行为的成本。

第二，数据和代码共享可以减少新程序的错误。例如一个学者独立编写了一个计算机程序，在一篇发表的论文中扩展了分析，对于研究人员用已发表的论文来校准基本情况是很有用的，这会减少了在新程序中出错的机会。

第三，机械性工作的问题。一些机械性工作（例如，形成因素组合）需要投入大量的时间和精力，但为什么学者必须独立地重复同样的过程？这样做是在浪费学者的时间和精力，而这些时间和精力可以用于更具创新性的项目。例如计算机科学领域正在转向一个更加协作的模式。如果一个学者试图解决计算机科学中的一个问题，他们的第一站是Github，那里很可能有人会共享解决这个问题或类似问题的代码，这会使得研究更加有效。